技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
22
0
AI & Data
進入AI的世界
系列 第
22
篇
➤D-22 深度學習與主要神經網路-2(CNN)
15th鐵人賽
epoch
團隊
臣無禮
2023-10-07 08:41:57
402 瀏覽
分享至
CNN
CNN基本概念
CNN定義
一種利用卷積(Convolution)與池化(Pooling)技術分別來有效地「提取影像特徵」以及「壓縮降低特徵維度」的一種深度學習神經網路。
主要成分為輸入層(Input Layer)、卷積層(Convolution Layer)、池化層(Pooling Layer)、全連接層(Fully Connected)及輸出層(Output Layer)五種網路架構。
CNN背景
①運算效率問題:若一個1000 * 1000等於100萬像素照片,如隱藏層也是1000個節點,有10層,則整個網路就等於100萬乘以1000乘以10,等於100億個連結。這不僅需要很大的運算力,訓練起來也很耗時。
②圖像特徵提取(Feature Extraction)問題:傳統的FC只用一維的像素當作輸入,來單獨處理像素與下一層節點的關係,而CNN就是利用二維的卷積層,或稱之為一個濾鏡(Filter),用來掃描圖像內的各種特徵,利用這種工具來處理,快速又有效。
③影像處理三大特性:
⓵局域性(Locality)問題:其他距離遙遠的天空、山、樹、河流的像素則與鳥嘴一點關係都沒有,不需要去處理這些關係。但傳統的FC則是要計算每個像像素與圖像內每個像素的關係,這是一個很沒有效率的架構。
⓶平移性(Translatability):圖像辨識是要了解這個圖像內「有無存在著那些特定的特徵」,卻不管這個特徵的「位置」在圖像的哪個方位。但在CF架構下,由於其關心每個像與像素之間的關係,因此不同位置、角度的鳥其運算出來的特徵值都不同。
⓷縮放性(Scaling)問題:縮放性指的是物件的大小問題,大尺寸的鳥是鳥,小尺寸的鳥也是鳥,物件等比例的放大不應該會影響其內容。但在傳統FC的架構下,大鳥與小鳥計算出來的特徵值也完全不同,這也會造成物件辨識很大的麻煩。
上述圖像辨識的三大問題,因此為了提升AI在圖像辨識的效率性與精確度,並降低運算的時間與成本,而催生出了AI電腦視覺重大突破性武器—CNN。
CNN架構特色與運算
濾鏡的利用與訓練
①濾鏡的運用:CNN主要精神是利用二維的各種濾鏡去掃描圖像內的物件,去偵測其是否存在某些特定特徵。特徵吻合度愈高,則物件為此類別的概率就愈高,反之則愈低。
②濾鏡的訓練:傳統上,圖像處理的濾鏡是由人類專家來設計,但在CNN上,濾鏡則是由機器在掃描過數十萬張人臉的照片後,其自行會經由不斷的試務,歸納出能辨別人臉的各種層次不同之濾鏡。
③濾鏡的運作、卷積的演算:主要演算方式為兩個二維矩陣中的演算,卷積的運算就是兩個矩陣的「內積和」(Dot Product),主要功用是在於當濾鏡掃描到原始圖像的某個區域時,若發現到與濾鏡有相同特徵的區塊時,則卷積輸出的數值會很大,若沒有對應到相同的特徵,則其卷積運算的特徵值就會很小,所以CNN就會以各種不同的「卷積濾鏡」,或稱之為卷積核(Convolution Kernel)來作為網路核心架構。而利用卷積核來擷取特徵的這一層神經網路就稱之為卷積層(Convolution Layer)。
特徵圖(Feature Map)
原始圖像透過不同的卷積核,在全圖一步步掃描後,會映射到新的一個多維空間,表示整個圖內哪些地方有圓形、三角形、方形的特徵存在,這個新的空間就稱為特徵圖。接著,特徵圖會當成下一層的輸入,如此不斷地遞疊而上,愈來愈複雜的卷積濾鏡會來尋找更複雜、高層的特徵。
池化層(Pooling Layer)
CNN透過降維(Dimension Reduction)將卷積後的特徵圖進行壓縮,用更抽象的特徵來代表原來的特徵,並以此來簡化後續運算的複雜度的一種演算技術。
①最大化(Max Pooling):擷取原矩陣中最大值取代原來的矩陣,由於仍有大數值的存在,因此知道此區塊有某種特徵。
②平均值(Average Pooling):
全連接層(Fully Connected Layer)
CNN經過卷積與池化處理後,最後為了要進行分類,還是要將最終的特徵圖攤平成為統一的全連接網路,稱之為全連接層。最後再將結果傳到分類層。
CNN處理圖像的優點
處理平移性問題
CNN透過濾鏡掃描捕捉圖像內物件的特徵,只要存在,不管物件的位置、方向,CNN都可以記住保留這些特徵。
處理區間性問題
相對於FC只以一個像素為處理單位,且作用在全區域,其作用(運算)只限於一個區域並不管非區域外的像素。
處理縮放性問題
CNN池化層的濾鏡也會以降維方式來簡化運算負擔。
權重共享性
傳統的FC每個像素與下一層像素的連結都有其獨一的權重,所以整個網路的權重數量非常大。但CNN利用濾鏡去掃描整個圖像的位置,亦即整個圖像都以這個固定的權重數量做演算,每個像素點都只共享這個濾鏡的權重。
參考資料
人工智慧-概念應用與管理 林東清著
留言
追蹤
檢舉
上一篇
➤D-21 深度學習與主要神經網路-1(類神經網路、深度學習)
下一篇
➤D-23 深度學習與主要神經網路-3(循環神經網路、自動編碼器)
系列文
進入AI的世界
共
30
篇
目錄
RSS系列文
訂閱系列文
2
人訂閱
26
➤D-26 核心應用☞自然語言處理-2(主要架構)
27
➤D-27 核心應用☞自然語言處理-3(特徵抽取1)
28
➤D-28 核心應用☞自然語言處理-4(特徵抽取2)
29
➤D-29 核心應用☞自然語言處理-5(主要演算模式1)
30
➤D-30 核心應用☞自然語言處理-6【完】(主要演算模式2)
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22195
篇
完賽人數
600
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
家中獨有一台設備wifi會斷斷續續
請問內網IP如何轉外網IP?
兩端防火牆使用IPSEC互PING之問題
Windows7升級Windows10後網路功能異常
SAMBA加入到WINDOWS AD SERVER的網域後,無法使用CENTOS"本機"帳號進入SAMBA分享的資料夾
python爬蟲 動態生成網頁104人力銀行
區域網路問題提問
vmware 虛擬機(windows)裡顯示使用容量與實際檔案容量不符合
HeidiSQL 查詢結果亂碼問題
如何寫公式才能利用excel 觸發一個數據時傳送一個訊息給 自已的line呢?有沒有可以用其它方式,來取代line notify 的方法,因為line 開始收費
熱門回答
請問內網IP如何轉外網IP?
家中獨有一台設備wifi會斷斷續續
Fortigate 50B 重置密碼
區域網路問題提問
HeidiSQL 查詢結果亂碼問題
熱門文章
每日一篇學習筆記 直到我做完專題 :( [Day29]
每日一篇學習筆記 直到我做完專題 :( [Day30]
每日一篇學習筆記 直到我做完專題 :( [Day31]
每日一篇學習筆記 直到我做完專題 :( [Day32]
Python 進階爬蟲工具 -Selenium : 安裝和使用ChromeDriver
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}